Aprendizaje por diccionarios dispersos

El aprendizaje por diccionarios dispersos (también conocido como codificación dispersa o SDL) es un método de aprendizaje de representaciones cuyo objetivo es encontrar una representación dispersa de los datos de entrada en forma de combinación lineal de elementos básicos, así como de los propios elementos básicos. Estos elementos se denominan átomos y componen un diccionario. No es necesario que los átomos del diccionario sean ortogonales, y pueden ser un conjunto sobrecompleto. Esta configuración del problema también permite que la dimensionalidad de las señales representadas sea mayor que la de las señales observadas. Las dos propiedades anteriores conducen a tener átomos aparentemente redundantes que permiten múltiples representaciones de la misma señal, pero también proporcionan una mejora en la escasez y la flexibilidad de la representación.

Una de las aplicaciones más importantes del aprendizaje de diccionarios dispersos es el campo de la detección comprimida o la recuperación de señales. En la detección comprimida, una señal de alta dimensión puede recuperarse con sólo unas pocas medidas lineales, siempre que la señal sea dispersa o casi dispersa. Dado que no todas las señales satisfacen esta condición de dispersidad, es muy importante encontrar una representación dispersa de esa señal, como la transformada wavelet o el gradiente direccional de una matriz rasterizada. Una vez que una matriz o un vector de alta dimensión se transfiere a un espacio disperso, se pueden utilizar distintos algoritmos de recuperación, como la búsqueda de bases, CoSaMP[1]​ o algoritmos rápidos no iterativos,[2]​ para recuperar la señal.

Uno de los principios clave del aprendizaje por diccionarios es que el diccionario debe inferirse a partir de los datos de entrada. La aparición de métodos de aprendizaje por diccionarios dispersos se vio estimulada por el hecho de que, en el tratamiento de señales, normalmente se desea representar los datos de entrada utilizando el menor número posible de componentes. Antes de este enfoque, la práctica general era utilizar diccionarios predefinidos (como las transformadas de Fourier o wavelet). Sin embargo, en ciertos casos, un diccionario entrenado para ajustarse a los datos de entrada puede mejorar significativamente la dispersión, lo que tiene aplicaciones en la descomposición, compresión y análisis de datos y se ha utilizado en los campos de la eliminación de ruido y clasificación de imágenes, y el procesamiento de vídeo y audio. Los diccionarios sparsity y overcomplete tienen inmensas aplicaciones en compresión de imágenes, fusión de imágenes e inpainting.

  1. Needell, D.; Tropp, J.A. (2009). «"CoSaMP: Iterative signal recovery from incomplete and inaccurate samples"». Applied and Computational Harmonic Analysis. doi:10.1016/j.acha.2008.07.002. 
  2. Lotfi, M.; Vidyasagar, M. "A Fast Non-iterative Algorithm for Compressive Sensing Using Binary Measurement Matrices. 

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search